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摘要 : [目的 /意义 ] 构建 国史 知识 检索 平台 ， 提 高 用 户 获取 国史 知识 的 效率 ， 促 进 国 史 宣 传 
和 教育 。[ 方 法 /过 程 ] 提出 基于 本 体 的 国史 知识 检索 平台 构建 思路 与 总 体 框架 ， 在 构建 国史 
本 体 知识 库 的 基础 上 ， 采 用 Neo4j 数据 库 作 为 RDF 数据 仓储 ， 创 建 基于 Solr 的 实例 索引 、 
三 元 组 索引 和 词 条 索引 , 钟 寺 多 种 检索 需求 设计 实现 了 检索 引擎 的 执行 流程 、 检 索 式 构 造 方 
法 以 及 查询 处 理 算法 ， 并 为 国史 知识 展示 设计 了 可 视 化 实现 方式 。[ 结 果 / 结 论 ] 构建 了 国史 
知识 检索 平台 ,提供 实体 检索 、 查 询问 答 、 关 联检 索 、 时 序 检索 及 语义 资源 浏览 等 检索 与 浏 
览 服务 ， 该 平台 框架 及 关键 技术 实现 方案 为 面向 领域 知识 的 深度 检索 服务 提供 了 重要 参考 。 
关键 词 : 本 体 ”实体 检索 ”查询 问答 ”关联 检索 ”可视化 
分 类 号 ; G250.7 


1. 引言 


随 着 互联 网 的 广泛 普及 ， 国史 宣传 教育 网 站 成 为 了 开展 国史 宣传 和 国史 教育 
的 重要 渠道 。 传 统 门 户 网 站 如 “中 华人 民 共 和 国史 教育 网 ”通过 栏目 导航 、 网 页 
浏览 、 多 媒体 等 方式 展现 新 中 国 成 立 以 来 的 奋斗 历程 、 伟 大 成 就 和 成 功 经 验 。 尺 
管 网 站 中 国史 信息 资源 丰富 ,但 对 于 国史 学 习 者 而 言 信息 量 庞大 , 即使 通过 全 文 
检索 的 方式 过 滤 信 息 ， 仍 然 无 法 直接 获得 需要 的 国史 知识 。 为 此 ， 有 必要 构建 一 
个 国史 知识 的 检索 与 浏览 平台 ,进一步 提 高 “中 华人 民 共 和 国史 教育 网 ”的 知识 
性 、 可 读 性 和 互动 性 , 让 读者 和 用 户 直 观 地 学 习 和 了 解 国史 知识 , 达到 以 史 鉴 今 、 
资 政 育 人 的 目的 。 

近 几 年 ， 国 外 机 构 推 出 了 Kngine、WolframAlpha 等 新 型 的 知识 引擎 系统 。 
Kngine 能 够 为 用 户 提供 更 有 意义 的 知识 搜索 结果 ， 如 理解 关键 词 或 概念 的 语义 
信息 , 回答 用 户 的 问题 , 发 现 关键 词 或 概念 之 间 的 关系 以 及 链接 不 同 的 数据 等 由。 
WolframAlpha 针对 问题 可 以 直接 给 出 有 效 答案 ， 如 在 被 问 到 “珠穆朗玛 峰 有 多 
高 ”之 类 的 问题 时 ，WolframAlpha 不 仅 能 给 出 海拔 高 度 ， 还 能 显示 这 座 世 界 第 
一 高 峰 的 地 理 位 置 、 附 近 有 什么 城镇 ， 以 及 一 系列 图 表 外 。 为 了 让 用 户 能 够 更 快 
更 简单 地 获得 查询 信息 ， 传 统 搜 索引 苟 公司 Google、 百 度 、 搜 狗 等 也 在 逐渐 从 
搜索 信息 向 搜索 知识 转型 ，Google 推出 了 Knowledge Graph 功能 , 可 以 更 好 的 理 
解 用 户 搜索 的 信息 ， 并 直接 将 检索 词 的 相关 信息 呈现 在 搜索 页 面 中 , 免 去 了 用 户 
访问 信息 出 处 网 站 这 一 过 程 馈 。 百 度 使 用 框 计算 技术 开发 了 一 些 实体 搜索 和 关联 
推荐 的 功能 ， 例 如 搜索 “类 似 盗 梦 空间 的 电影 ” 搜狗 的 知 立 方 搜索 能 够 进行 查 
询 语 义理 解 ， 通 过 推理 获得 “姚明 太太 的 身高 ”为 “190cm”， 同 时 也 相应 的 给 
出 了 姚明 太太 叶莉 的 资料 介绍 以 及 姚明 的 关系 图 谱 。 实 现 这 些 创新 应 用 的 基础 是 
构建 包含 实体 和 相关 事实 的 大 规模 知识 库 。 如 Google 从 Freebase、 维 基 百 科 或 
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全 球 概览 中 获得 专业 的 信息 构建 Knowledge Graph, 2012 年 Knowledge Graph 包 
含 的 实体 数量 就 已 经 超过 5.7 亿 个 名 。 搜 狗 知 立方 对 半 结 构 化 网 页 数据 进行 信息 
抽取 ， 从 文本 数据 中 抽取 实体 和 属性 ， 再 联合 结构 化 数据 进行 异 构 数 据 整 合 ， 构 
建 了 知 立方 本 体 知识 库 外 。 

不 仅 如 此 ， 目 前 互联 网 正 从 仅 包 含 网 页 和 网 页 之 间 超 链接 的 文档 万 维 网 
(Document Web) 转 变 成 包含 大 量 描述 各 种 实体 和 实体 之 间 丰 富 关系 的 数据 万 维 
网 (Data Web) Sl。 并且 大 量 的 语义 化 数据 如 RDF 和 OWL 仓储 数据 被 发 布 ， 开放 
关联 数据 LOD) 云 的 规模 日 益 庞大 ， 在 此 基础 上 能 够 构建 更 智能 的 检索 应 用 。 
如 Sindice 搜索 引擎 利用 息 虫 将 语义 网 上 的 RDF 数据 收集 起 来 , 提供 了 关联 数据 
网 的 实体 检索 和 查询 服务 四。 Semplore 搜索 引擎 使 用 关键 词 检索 和 结构 化 检索 的 
混合 检索 机 制 , 创建 了 关键 词 、 概 念 和 关系 三 种 类 型 的 倒 排 索引 ， 提供 关联 数据 
的 检索 查询 、 分 面 导航 服务 趾 。 FREyA 是 一 个 面向 本 体 的 交互 式 自然 语言 查询 接 
口 ， 使 用 语法 分 析 和 基于 本 体 的 查询 对 用 户 问 题 进行 解释 , 利用 用 户 反 馈 消解 歧 
义 ， 再 构造 SPARQL 查询 完成 查询 应 答 四 。Treo 集成 实体 搜索 、 扩 散 激活 搜索 
和 基于 Wikipedia 的 语义 相关 度 计 算 对 关联 数据 网 进行 检索 ， 将 解析 的 用 户 查 询 
与 数据 集中 的 数据 表示 进行 语义 匹配 时。MEANS 是 一 个 结合 自然 语言 处 理 和 语 
义 网 技术 的 医学 问答 系统 , 它 使 用 自然 语言 处 理 技 术 对 医学 问题 和 文档 进行 深层 
分 析 ， 为 文档 建立 RDF 标注 ， 将 用 户 问题 转换 为 SPARQL 查询 ， 实 现 针 对 医学 
文档 集 的 查询 问答 中。 

在 借鉴 现 有 相关 研究 和 系统 的 基础 上 ， 本 文 提出 了 基于 本 体 的 国史 知识 检索 
平台 的 建设 思路 ， 介 绍 了 平台 的 总 体 框 架 ， 对 关键 技术 实现 方案 进行 了 阐述 ， 最 
后 展示 了 平台 的 实现 效果 。 

2. 平 台 设 计 
2.1 设计 思路 

国史 知识 检索 平台 的 建设 目标 是 在 构建 的 国史 本 体 知 识 库 基 础 上 , 对 外 提供 
检索 查询 、 浏 览 导 航 、 知 识 展示 等 功能 ， 让 用 户 可 以 方便 地 阅读 收录 和 编辑 的 国 
史 知 识 。 为 达到 这 个 目标 ， 我 们 提出 了 平台 的 设计 思路 ; 

(1) 建立 国史 本 体 知 识 库 的 有 效 存 储 和 灵活 访问 机 制 ， 实 现 国史 知识 的 语 
义 组 织 和 进一步 利用 ; 

(2) 借助 本 体 的 结构 化 语义 和 推理 规则 ， 实 现 国史 知识 的 细 粒 度 揭 示 和 洪 
在 知识 挖掘 ; 

(3) 提供 面向 国史 知识 实体 的 检索 与 浏览 功能 ， 支 持 实体 之 间 的 关联 发 现 
服务 ; 

(4) 实现 查询 问答 功能 ， 人 允许 用 户 提出 国史 问题 ， 系 统 直接 返回 答案 ， 而 
不 是 相关 的 历史 文本 资料 ; 

(5) 通过 国史 知识 图 谱 的 方式 可 视 化 展示 国史 知识 关联 ， 便 于 用 户 直观 地 
了 解 相 关 信 息 ; 

C6) 通过 文本 资源 的 语义 链接 进行 知识 实体 的 跳 转 浏览 ， 允 许 用 户 进行 延 
伸 性 阅读 。 

2.2 总 体 框 架 

根据 平台 设计 思路 , 确定 国史 知识 检索 平台 的 总 体 框架 如 图 1 所 示 , 包括 数 
据 层 、 功 能 层 和 服务 层 三 个 层次 。 数 据 层 提供 数据 仓储 和 数据 访问 等 基本 功能 ， 
底层 分 别 存储 了 构建 的 国史 本 体 知 识 库 以 及 收集 的 国史 教育 文本 资源 , 并 为 支持 


检索 应 用 构建 了 实例 索引 、 三 元 组 索引 和 词 条 索引 ， 同 时 提供 对 底层 存储 以 及 索 
引 的 数据 调用 接口 ,允许 检 索引 擎 进行 数据 访问 。 功 能 层 由 国史 知识 检索 引擎 完 
成 检索 平台 的 查询 分 析 、 检 索 调 度 、 结 果 计 算 等 核心 功能 。 检 索引 擎 对 用 户 输入 
进行 查询 解析 ,推荐 相关 检索 词 ， 并 根据 解析 结果 构建 相应 的 检索 表达 式 进而 执 
行 检 索 调 度 完 成 检索 任务 。 检 索 过 程 中 利用 了 国史 本 体 的 推理 机 制 挖掘 隐 含 知识 
来 扩展 检索 的 范围 ， 并 对 返回 结果 进行 统计 和 排序 等 操作 。 在 服务 层 ， 为 用 户 提 
供 实 体检 索 、 查 询问 答 、 关 联检 索 、 全 文 检索 和 时 序 检索 等 基本 检索 服务 ， 由 检 
索引 党 执行 检索 ,通过 可 视 化 显示 国史 实体 的 知识 图 诺 以 及 文本 资源 ; 8 3 (c 

等 提高 用 户 对 于 国史 知识 的 获取 效率 , 并 借助 平台 揭示 洪 在 知识 和 推导 隐 含 知识 ， 
支持 用 户 进 一 步 的 知识 发 现 。 


图 1 总 体 框架 


3. 关 键 技术 实现 


3.1 国史 本 体 知识 库 构 建 

国史 本 体 知识 库 是 建立 国史 知识 检索 平台 的 基础 。 在 借鉴 其 他 历史 本 体 构建 
经 验 的 基础 上 , 针对 国史 领域 特色 ,作者 提出 了 国史 本 体 的 思路 和 方法 ,构建 了 
国史 本 体 的 概念 模型 沁 。 通 过 国史 本 体 对 人 物 、 机 构 、 会 议 、 事 件 等 知识 实体 、 
概念 及 其 关系 进行 规范 化 和 语义 化 表示 。 国 史 本 体 定义 了 事件 、 会 议 、 人 物 、 机 
构 、 文 件 、 理 念 或 术语 等 19 个 类 以 及 20 个 数值 属性 、76 个 对 象 属性 ， 并 根据 
常识 知识 定义 了 一 些 属性 约束 和 推理 规则 。 从 而 确定 了 国史 知识 实体 的 分 类 以 及 
实体 关系 类 型 ， 用 于 指导 国史 本 体 知识 库 的 构建 。 

国史 本 体 知识 库 的 主要 知识 来 源 是 辅助 国史 教育 的 基础 工具 书 ， 如 《中 华人 
民 共 和 国 国 史 百 科 全 书 入 《中 国共 产 党 历史 大 辞典 》 等 。 由 于 单纯 依靠 人 工 创建 
国史 知识 实体 和 关系 耗 时 耗 力 , 为 此 使 用 自动 处 理 与 人 工 加 工 相 结合 的 方法 从 文 
本 中 提取 明确 的 国史 知识 。 首 先 , 由 领域 专家 挑选 重要 的 国史 词 条 作为 国史 知识 
发 掘 的 基础 资源 ， 收 集 整 理 国 史 相 关 的 人 物 表 、 机 构 表 等 主题 词 表 ， 并 从 一 些 工 
具 书 中 提取 词 条 名 称 、 类 型 、 时 期 等 重要 的 元 数据 ， 通 过 人 工整 理 和 校 验 ， 转 化 
为 基础 的 本 体 实例 以 及 基础 数值 属性 。 利 用 这 些 实例 数据 对 收集 的 国史 词 条 进行 
自动 标注 , 提取 国史 实体 可 能 相关 的 关系 或 属性 数据 , 作为 人 工 加 工 的 辅助 信息 。 
在 国史 本 体 概念 模型 的 约束 下 ， 人 工 修订 或 构建 本 体 实例 , 编辑 实例 属性 和 关系 


言 息 ， 并 对 编辑 的 数据 进行 审核 和 管理 ,逐步 构建 出 包含 重要 国史 知识 的 国史 本 
体 知 识 库 。 目 前 构建 的 国史 本 体 知 识 库 共 包括 15,602 个 实例 ,5,147 条 属性 信息 ， 
21,503 条 实例 关系 。 

3.2 neo4j 存储 

针对 国史 本 体 知 识 库 的 特点 ,选用 图 数据 库 Neo4j 作为 底层 数据 仓储 ,支持 
结构 化 检索 、 关 联检 索 等 复杂 的 检索 需求 。Neo4j 是 一 个 高 性 能 的 NoSQL 图 数 
HE, 用 高 效 的 网 数据 结构 代替 传统 的 表 设 计 , 将 数据 保存 为 图 的 节点 以 及 节点 
之 间 的 关系 ， 并 提供 了 图 的 查找 和 遍历 功能 。 风 数据库 Neo4j 具有 很 好 的 可 扩展 
性 和 灵活 性 ， 适 用 于 复杂 关系 的 管理 与 查询 推理 ， 符 合 基于 RDF 图 数据 模型 的 
本 体 知 识 库 三 元 组 存储 和 SPARQL 查询 需求 。 

在 Neo4j 数据 库 中 , 将 国史 本 体 知 识 库 中 的 每 个 实例 保存 为 一 个 节点 ， 实例 

的 数值 属性 存储 为 节点 的 属性 和 属性 值 , 实例 关系 存储 为 节点 和 节点 之 间 的 二 元 
有 向 关系 。 例 如 ， 存 储 实例 “毛泽东 ”时 ， 在 Neo4j 数据 库 中 新 增 一 个 节点 ， 自 动 
生成 节点 ID 为 327， 根 据 该 实例 在 知识 库 中 的 信息 ， 定 义 节 点 属性 “label” 的 
数学 值 为 “毛泽东 ” 定义 节点 属性 “altLabel” 的 属性 值 为 “ 毛 主 席 *"。 此 外 ， 依 据 
国史 本 体 定义 “ 曾 任职 务 ”、“ 所 属 党 派 ”* 等 关系 类 型 ， 定 义 节点 关系 
relationship[328]: 曾 任 职务 CERK”, “中 华人 民 共 和 国 主席 1949”), 
relationship[326]: 所属 党 派 〈“ 毛 译 东 ” “中国 共产党 >”) 等 。 

3.3 索引 设计 
采用 Apache Solr 索引 技术 ， 对 国史 本 体 知 识 库 中 的 实例 和 属性 关系 以 及 国 
史 教 育 文本 资源 构建 索引 ， 提 高 查询 速度 和 系统 响应 时 间 。 根 据 检索 需求 ， 构 建 
了 三 种 索引 包括 : 
(OD 实例 索引 
实例 索引 用 于 实现 国史 实体 的 快速 检索 和 分 面 导 航 等 功能 ， 主 要 字段 包括 : 
id、 规 范 名 称 label、 其 他 名 称 altLabel、 首 字母 initial、 实 体 类 型 entityType、 相 
关 词 条 textItemID 等 。 检 索引 擎 在 用 户 输入 检索 词 时 根据 用 户 的 输入 实时 检索 实 
例 索 引 给 出 检索 词 提 示 ， 对 用 户 输入 解析 后 利用 label 和 altLabel 字段 进行 精确 
匹配 和 模糊 匹配 ,返回 匹配 或 推荐 的 实例 ,并 根据 实体 类 型 和 首 字 母 等 索引 字段 
对 实例 进行 分 面 导 航 。 
(2) 三 元 组 索引 
三 元 组 索引 用 于 支持 对 国史 本 体 知识 库 的 快速 检索 , 即 对 知识 库 的 三 元 组 构 
建 索 引 ， 主 要 字段 包括 三 元 组 陈述 主体 的 sSID、 名 称 sLabel、 类 型 sType、 类 型 
名 称 sTypeValue， 谓 词 的 pID、 名 称 pLabel、 类 型 pType、 类 型 名 称 pTypeValue 

以 及 客体 的 sID、 名 称 sLabel. XA! sType、 类 型 名 称 sTypeValue、 知 识 来 源 词 
条 textItemID 等 。 三 元 组 索引 的 构建 为 结构 化 的 关系 检索 提供 了 前 提 条 件 ， 检索 
引擎 构建 类 似 SPARQL 查询 语言 的 Solr 检 索 式 实现 国史 本 体 知 识 库 的 检索 应 用 。 

(3) 词 条 索引 

词 条 索引 针对 收录 的 国史 教育 资源 文本 词 条 进行 索引 , 文 持 文本 资源 的 全 文 
检索 功能 ， 主 要 字段 包括 : 词 条 ID, WH itemTitle、 文 本 内 容 itemText、 类 型 
itemType 以 及 词 条 来 源 库 itemSource 等 。 
3.4 检索 引擎 功能 实现 

为 满足 用 户 不 同 的 检索 需求 ， 国 史 知 识 检索 平台 设计 了 三 个 检索 入 口 : 普 
通 检 索 、 关 联检 索 和 时 序 检索 。 普 通 检 索 允 许 用 户 输入 检索 词 或 语句 查询 相关 
的 国史 知识 ， 关 联检 索 允 许 用 户 输入 两 个 检索 词 来 获得 实体 之 间 的 相互 关联 ， 


时 序 检索 用 于 检索 限定 时 间 范 围 内 的 事件 、 会 议 、 文 献 等 。 
3.4.1 检索 执行 流程 
面向 三 个 检索 入 口 ， 检 索引 擎 分 别 依据 检索 输入 类 型 、 检 索 目 标 范 围 、 输 


出 结果 等 设 定 相应 的 检索 处 理 方式 ， 有 基体 执行 流程 如 图 2 所 示 。 

普通 检索 入 口 关联 检索 入 口 时 序 检索 入 口 

自然 语言 处 理 实体 识别 
实体 间 、 变 体 词 1 时 间 范围 

候选 提示 检索 类 型 选择 
检索 式 构造 
检索 式 | 实例 检索 | [ 关系 检索 
关联 检索 | | 全 文 检索 | [ 时 序 检索 


| 检索 执行 
检索 结果 


图 2 检索 执行 流程 

普通 检索 入 口 允 许 用 户 输 入 任意 的 检索 词 查 询 目标 实体 的 相关 国史 知识 ， 
同时 也 可 以 输入 查询 问题 获得 国史 知识 答案 。 为 此 ， 检 索引 擎 首先 使 用 自然 语 
义 处 理 技术 对 普通 检索 输入 进行 处 理 ， 从 检索 词 或 语句 中 提取 国史 本 体 知识 库 
中 的 实体 词 和 预定 义 的 变 体 词 ， 依 据 命中 情况 构造 实例 检索 式 、 全 文 检索 式 、 
关系 检索 式 或 关联 检索 式 。 如 果 存 在 具有 相同 名 称 的 实体 或 无 命中 结果 将 候选 
实体 和 模糊 匹配 推荐 的 实体 提示 给 用 户 ， 由 用 户 选择 检索 目标 ， 再 构造 相应 的 
检索 式 。 

关联 检索 要 求 用 户 输入 两 个 实体 的 名 称 。 同 样 ， 如 果 通 过 实体 识别 命中 知 
识 库 中 两 个 不 同 的 实体 则 直接 构建 关联 检索 式 进 而 执行 检索 ， 如 果 命 中 一 个 相 
同 的 实体 ， 则 提示 给 用 户 转 化 为 实体 检索 ， 如 果 命 中 多 个 或 无 命中 结果 则 将 候 
选 实体 和 模糊 匹配 推荐 的 实体 返回 给 用 户 ， 由 用 户 选 择 两 个 实体 再 构建 检索 式 。 

时 序 检索 由 用 户 输入 以 年 份 为 单位 的 起 始 时 间 和 终止 时 间 范 围 ， 选 择 事件 、 
会 议 或 文献 等 返回 类 型 ， 检 索引 擎 根据 用 户 的 选择 构造 出 相应 的 检索 式 。 

检索 式 构造 完成 后 ， 由 检索 引擎 选择 具体 的 索引 或 数据 库 执 行 检索 任务 ， 
返回 检索 结果 ， 并 对 检索 结果 进行 统计 和 排序 。 
3.4.2 检索 式 构 造 

国史 本 体 知识 库 的 构建 使 得 国史 知识 成 为 了 可 计算 的 结构 化 数据 ， 使 用 类 似 
SPARQL 语言 的 查询 方式 对 知识 库 进 行 检索 可 实现 细 粒 度 国 史 知 识 的 检索 服务 。 
经 过 查询 解析 ,检索 引擎 根据 检索 需求 构建 如 下 几 种 不 同 的 检索 表达 式 ， 分 别 执 
行 检索 任务 。 

(1) 实例 检索 

实例 检索 通过 实例 名 称 、 其 他 名 称 、 类 型 等 字段 检索 实例 索引 ， 返 回 精确 匹 
配 或 模糊 匹配 的 实例 结果 ， 并 对 结果 集 进行 名 称 排序 或 相关 度 等 操作 。 例 如 检索 
精确 匹配 名 称 为 “一 国 两 制 ” 的 实例 检索 式 为 : 

query-(label: "一 国 两 制 ") OR (altLabel: "一 国 两 制 ") (1) 

检索 引擎 将 检索 式 传递 给 实例 索引 服务 器 执行 检索 任务 ， 然 后 对 检索 结果 进 

行 封 装 和 处 理 输送 到 前 端 显示 。 


(20 关系 检索 
关系 检索 主要 面向 三 元 组 索引 。 如 果 已 知 国史 本 体 知识 库 中 某 个 实例 查询 其 
相关 属性 和 关系 ， 即 通过 指定 三 元 组 (s,p,o) 中 s 或 o 为 指定 实例 ， 返 回 三 元 组 
结果 集 。 例 如 用 户 在 普通 检索 入 口 输入 检索 词 “ 毛 泽 东 ” 检索 引擎 首先 进行 查 
询 解析 ， 获 取 命 中 实体 对 应 的 实例 ID 为 6787， 检 索引 擎 构造 关系 检索 式 为 : 
query-(sID:6787) OR (oID:6787) (2) 
如 果 已 知 国史 本 体 知识 库 中 某 个 实例 和 指定 属性 查询 该 实例 通过 指定 关系 
关联 的 实例 或 具有 的 属性 值 ， 即 通过 指定 三 元 组 (sp,o) 中 s 和 Pp 或 者 p 和 o 来 
查询 知识 库 返 回 对 应 的 三 元 组 结果 集 。 例 如 查询 “中 共 十 一 届 三 中 全 会 ”的 “ 参 
会 者 ”， 检 索引 擎 针对 三 元 组 索引 构造 关系 检索 式 为 : 
query- (sLabel:" 中 共 十 一 届 三 中 全 会 ") AND (pLabel:" 参 会 者 ") (3) 
根据 领域 特性 ， 国 史 本 体 中 定义 了 一 些 属性 约束 和 推理 规则 ， 在 检索 式 构造 
时 ， 检 索引 擎 应 用 本 体 推理 机 制 对 检索 式 进行 了 重 构 。 如 上 例 中 ， 由 于 本 体 中 和 定 
义 了 对 象 属性 “DRA” 和 “ 参 会 ”相互 为 逆 关 系 ， 以 及 “会 议 的 发 言 人 和 报告 
一 定 参 加 了 会 议 ” 的 规则 ， 检 索 式 重 构 为 : 
query-((sLabel:' wy 十 一 届 三 中 全 会 ") AND (pLabel:" 参 会 者 ' 0 
OR ((pLabel:" 参 会 ") AND (oLabel:" 中 共 十 一 届 三 中 全 会 
OR ((sLabel:" 中 共 十 一 届 三 中 全 会 ") AND (pLabel:" 发 言 EN 
(4) 


从 而 发 现 未 明确 表示 的 国史 知识 ， 扩 展 了 关系 检索 的 范围 。 
(3) 关联 检索 
关联 检索 针对 国史 本 体 知识 库 中 三 元 组 集合 所 形成 的 图 结构 特性 ， 在 已 知 两 
个 不 同 实例 的 情况 下 , 通过 查询 两 个 实例 对 应 图 节点 之 间 的 路 径 获 取 实 例 之 间 直 
接 或 间接 关系 。 系 统 设 定 关联 度 选项 * 近 ”“ 稍 远 ? 和 * 远 ?”， 由 用 户 选择 其 一 查询 
两 个 实例 之 间 长 度 不 大 于 2、3 或 4 的 路 径 ， 返 回 经 过 路 径 的 三 元 组 集合 。 关 联 
检索 的 执行 借助 Neo4j 数据 库 的 图 遍历 机 制 ， 通 过 Cypher 查询 语句 检索 Neo4j 
数据 库 获 取 查 询 结果 。 例 如 检索 “邓小平 ”和 “中 共 十 一 届 三 中 全 会 ”之 间 “ 稍 
远 ” 的 关联 ， 检 索引 擎 首先 对 检索 词 进行 实体 识别 ， 获 取 命 中 实体 ID 为 5904 
和 14563， 则 构造 Cypher 查询 语句 : 
start a=node(*), b-node(*) match p-a-[*0..3]-b 
where a.source id-5904 and b.source id-14563 
return p order by length(p) asc; (5) 
检索 引擎 连接 Neo4j 数据 库 读 取 查询 结果 ， 解 析 结果 集 输出 到 系统 前 台 。 
(4) 全 文 检索 
全 文 检 索 主 要 针对 国史 教育 文本 资源 ， 利 用 检索 词 在 词 条 索引 中 对 词 条 题目 
和 词 条 内 容 执 行 全 文 检索 ， 通 过 Solr 集成 mmseg4j 中 文 分 词 工具 完成 全 文 检索 
任务 ， 并 根据 相关 度 排 序 返 回 相 关 词 条 。 如 检索 “中 共 十 一 届 三 中 全 会 ”的 相关 
词 条 ， 则 构造 检索 式 : 
query- (itemTitle: 中 共 十 一 届 三 中 全 会 ) OR (itemText: 中 共 十 一 届 三 中 全 会 ) (6) 
(50 时 序 检索 
时 序 检索 主要 与 时 间 类 相关 ， 如 检索 时 间 区 间 内 发 生 的 事件 、 召 开 的 会 
出 版 的 文献 等 。 即 查询 Cpo) 中 s 的 类 型 为 事件 、 会 议 或 文献 (文件 、 a 
报纸 刊物 、 报 告 讲话 等 ) 而 o 的 类 型 为 时 间 类 的 三 元 组 。 由 于 通常 史料 记载 的 时 
间 取 值 相对 模糊 , 在 构建 本 体 实例 时 直接 保留 了 原 有 取 值 , 为 了 便于 计算 检索 平 


台 对 时 间 类 定义 了 开始 时 间 和 结束 时 间 属 性 ， 将 时 间 单 位 设 定 到 “月 ” 在 构建 
索引 时 制定 转换 规则 将 “上 半年 ””“ 春 ”“ 年 底 ” 等 模糊 时 间 映 射 到 具体 的 年 月 。 
如 查询 1949 年 -1950 年 间 发 生 的 事件 ， 检 索 式 为 : 
query=(sTypeValue:" 事 件 ") AND (oTypeValue:" 时 间 类 ") 
AND (startDate:[194901 TO 195012]) (7) 

3.4.3 查询 处 理 算法 

普通 检索 入 口 允许 用 户 输 入 检索 词 和 提问 语句 ， 其 查询 处 理 方法 相对 关联 检 
索 和 时 序 检索 而 言 较为 复杂 ,对 此 本 文 提 出 了 碍 询 处 理 算法 。 检 索引 擎 首先 对 用 
户 输入 的 字符 串 进行 解析 。 由 于 国史 知识 实体 的 名 称 通常 为 中 文 并 且 字 符 长 度 都 
不 小 于 2， 因 此 判断 输入 字符 数目 如 果 小 于 2， 则 执行 实例 检索 ， 推 荐 一 些 候选 
实体 给 用 户 。 和 否则， 采用 自然 语言 处 理 技术 ， 利 用 知识 库 中 的 实例 名 称 和 别称 作 
为 词典 对 输入 进行 实体 标注 ， 如 果 命 中 的 实体 数目 多 于 2 个 , 则 转换 为 针对 文本 
词 条 的 全 文 检索 ， 查 找 与 输入 相关 的 词 条 。 如 果实 体 数 目 为 2 个 ， 则 转换 为 查询 
两 个 实体 之 间 关 联 的 检索 。 否 则 ,利用 人 工 定 义 的 变 体 词 表 对 输入 进行 识别 ， 如 
果 没 有 命中 变 体 词 , 而 命中 了 一 个 实体 则 将 查询 转换 为 针对 其 实体 的 关系 检索 返 
回 实体 所 有 相关 三 元 组 , 或 者 如 果实 体 和 变 体 词 都 没有 命中 则 进行 实例 检索 推荐 
相似 的 实体 给 用 户 。 如 果 命 中 变 体 词 ， 则 根据 预定 义 关 系 表 将 变 体 词 映射 到 具体 
的 本 体 属 性 或 类 上 。 例 如 ， 将 “什么 时 候 召 开 ”“ 何 时 召开 ”和 “召开 的 时 间 ” 
映射 到 本 体 属 性 “召开 时 间 ”， “地 区 ”“ 地 方 ” 和 “哪里 ”对 应 本 体 类 “国家 和 
地 区 ” 再 根据 属性 列表 和 类 列表 进一步 分 析 ， 在 命中 实体 数 为 1 的 情况 下 ， 如 
果 属 性 列表 数目 大 于 零 ， 则 将 检索 转换 为 针对 该 实体 指定 属性 的 关系 检索 ,否则 
根据 类 列表 返回 命中 实体 与 指定 所 属 类 实体 之 间 三 元 组 的 关系 检索 , 如 果 属 性 列 
表 和 类 列表 都 为 空 则 转换 为 实体 的 三 元 组 关系 检索 。 在 没有 命中 实体 却 命中 变 体 
词 的 情况 下 ， 如 果 变 体 词 对 应 类 列表 规模 大 于 0， 则 转换 为 指定 实体 所 属 类 的 实 
例 检 索 ， 否 则 转换 为 输入 字符 串 的 全 文 检 索 。 由 此 ,利用 实体 词 表 和 变 体 词 表 实 
现 了 对 于 查询 问题 的 自然 语言 处 理 , 形成 针对 具体 情况 的 多 种 检索 式 , 达到 了 从 
知识 库 和 文本 资源 中 查找 国史 知识 的 目的 。 具 体 算 法 如 下 所 示 : 

表 1 查询 处 理 算法 


01. 输 入 : 用 户 输入 字符 串 input 
02. IF. 输入 中 文字 符 长 度 length(input)<2 
03. 推荐 相关 实例 给 用 户 query=( 实 例 检 索 ,(label:input OR altLabel:input)); 


04. ELSE{ 

05. 获取 命中 实体 列表 entityList=entityAnnotation(input); 

06. IF 实体 数目 size(entityList)>2 

07. 转换 为 全 文 检 索 query=( 全 文 检索 ,input); 

08. ELSE( 

09. IF 实体 数目 size(entityLisD=2 

10. 转换 为 关联 检索 query=( 关 联检 索 ,entity1,entity2); 

11. ELSE{ 

12. 去 除 已 标注 字符 input_new=replace(input); 

13. IF 中 文字 符 长 度 length(input_new)<2 

14. 变 体 词 列 表 为 空 variantList=null; 

15. ELSE( 

16. 获取 命中 变 体 词 列 表 variantList-variantAnnotation(input); 
17. IF 变 体 词 数目 size(variantList)=0 ( 

18. IF 实体 数目 size(entityList)=1 

19. 转换 为 关系 检索 query=( 关 系 检索 ,(s:entity1)); 
20. ELSE 


21. 推荐 相关 实例 给 用 户 query=( 实 例 检 索 ,(label:input OR altLabel:input)); 


22. } ELSE( 


23. 通过 变 体 词 表 获 得 变 体 词 对 应 的 属性 列表 propertyList 和 类 列表 classList; 
24. IF 实体 数目 size(entityList)-11 

25. IF 对 应 属性 数目 size(propertyList)>0 

26. 转换 为 关系 检索 query=( 关 系 检索 ,(s:entity1)AND(p in propertyList)); 
27. ELSE( 

28. IF 对 应 类 数目 size(classList)>0 

29. 转换 为 关系 检索 query=( 关 系 检索 ,(s:entity1)AND(o_type in classList)); 
30. ELSE 

31. 转换 为 关系 检索 query=( 关 系 检索 ,(s:entity1)); 

32. } 

33. } ELSE{ 

34. IF 对 应 类 数目 size(classList)>0 

35. 转换 为 实例 检索 query=( 实 例 检 索 ,(entity in classList)); 

36. ELSE 

37. 转换 为 全 文 检 索 query=( 全 文 检索 ,input); 

38. H 

39. H 

40. } 

41. } 

42. } 

43. } 


44. 输出 : query 


3.5 可 视 化 实现 

为 直观 地 疝 用 户 展 示 国 史 知 识 之 间 的 相关 关联 ， 选 用 Cytoscape Web 工具 实 
现 国史 知识 图 谱 的 可 视 化 展示 。Cytoscape Web 是 一 个 开源 的 图 形 可 视 化 库 ， 它 
的 数据 模型 支持 节点 和 有 问 边 , 可 以 定义 节点 和 边 的 名 称 和 类 型 ,满足 知识 库 实 
例 和 关系 名 称 显示 和 配置 的 应 用 需求 。Cytoscape Web 网 络 显 示 的 主要 组 件 通过 
Flex/ActionScript 实现 ， 可 视 化 样式 多 样 ， 并 且 提 供 了 实现 网 络 视图 的 定制 和 交 
互 的 JavaScript API， 支 持 视图 的 缩放 、 拖 搜 、 节 点 与 边 的 点 击 事件 、 类 型 筛选 
等 功能 。 

在 项 目 工程 中 引入 Cytoscape Web 的 js 文件 ， 通 过 后 台 程 序 封装 可 视 化 显示 
的 数据 信息 ， 包 括 节 点 和 边 的 颜色 、 名 称 、 类 型 、 显 示 样 式 等 信息 ， 生 成 json 
格式 传递 至 前 台 显 示 ， 利 用 自 定义 jQuery 方法 进行 解析 ， 配 置 图 形 样式 并 实现 
Ajax 操作 ， 通 过 引用 Cytoscape Web 的 js 方法 绘制 图 形 和 实现 事件 响应 。 
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在 可 视 化 窗口 中 ， 用 节点 代表 实体 ， 两 个 节点 之 间 的 有 向 边 揭 示 实 体 之 间 的 
关系 ， 通 过 不 同 的 颜色 代表 实体 所 归属 的 类 ， 直 观 地 呈现 知识 图 谱 。 同 时 ， 提 供 
丰富 的 用 户 交 互 功能 ,例如 通过 译 动 的 操作 面板 上 下 左右 移动 、 缩 小 或 放大 图 形 
以 及 适应 窗口 尺寸 ,在 空白 处 点 击 儿 秒 钟 鼠标 箭头 变 成 小 手 图 标 可 以 实现 对 图 形 
的 整体 拖 动 ,同样 也 可 以 拖 搜 节点 。 左 键 单 击 节点 可 以 进一步 浏览 该 节点 的 知识 
图 谱 , 右键 单 击 节点 显示 节点 的 详细 信息 , 左 键 单 击 边 可 以 在 图 上 显示 该 边 的 名 
称 ， 右 键 点 击 边 可 以 查看 该 节点 关系 的 知识 来 源 〔 知 识 来 源 文 本 条 目 )， 点 击 窗 
口 右 侧 本 体 类 颜色 注释 可 进行 筛选 窗口 内 相关 实体 的 类 型 。 系 统 支持 可 视 化 浏览 
功能 ， 用 户 可 以 通过 点 击 知识 图 谱 中 的 节点 不 断 获 取 相 关 的 国史 知识 。 如 图 3 
所 示 ， 如 浏览 “中 共 十 一 届 三 中 全 会 ”的 知识 图 谱 时 ， 显 示 “ 中 共 十 一 届 三 中 全 
会 ”的 参 会 者 ， 点 击 其 中 一 个 参 会 者 人 物 “ 华 国 锋 ”， 可 以 进一步 浏览 它 的 相关 
知识 ， 获 得 事件 “中 美 建交 ”通过 “相关 人 物 ” 关 系 指向 “ 华 国 锋 ”， 点 击 “ 中 
美 建交 ”节点 进一步 获得 相关 的 人 物 、 事 件 、 文 献 、 子 事件 等 知识 。 系 统 保留 了 
浏览 的 路 径 和 历史 记录 , 允许 返回 操作 。 由 此 实现 了 基于 知识 图 谱 的 漫游 式 浏览 ， 
有 利于 用 户 直 接 、 便 捷 地 获取 国史 知识 。 


4 平台 实现 效果 


在 上 述 平台 设计 和 关键 技术 实现 的 基础 上 ,完成 了 国史 知识 检索 平台 的 建设 。 
该 平台 是 基于 B/S 模式 的 Web 应 用 系统 ， 使 用 Java 语言 开发 ， 采 用 springMVC 
和 hibernate 作为 开发 框架 ， 数 据 库 使 用 Neo4j 2.1.2 Win64 免费 版 本 ，Solr 版 本 
为 4.7.2， 系 统 运行 环境 为 Windows 2008 服务 器 操作 系统 ， 以 Tomcat 6.0.4 作为 
Web 服务 器 ， 使 用 JDK 1.7。 检 索 平台 实现 了 实体 检索 、 查 询问 答 、 关 联检 索 、 
时 序 检索 、 语 义 资源 浏览 等 服务 功能 。 

4.1 实体 检索 

区 别 于 将 检索 词 匹配 的 国史 教育 文本 资源 呈现 给 用 户 的 传统 检索 方式 , 国史 
知识 检索 平台 将 国史 本 体 知 识 库 内 部 与 检索 目标 匹配 的 实体 相关 知识 通过 可 视 
化 方式 展示 给 用 户 。 用 户 不 需要 通过 阅读 文本 信息 就 可 以 直观 地 了 解 相关 的 国史 
知识 ， 同 时 通过 知识 图 谱 的 点 击 操作 可 以 进行 延展 性 阅读 , 这 使 得 国史 知识 的 获 
取 更 有 效率 。 如 检索 事件 土地 改革 运动 ”返回 的 知识 图 谱 如 图 4 所 示 ， 可 以 清晰 
的 看 到 与 “土地 改革 运动 * 相 关 的 会 议 、 事件、 文件、 理念 或 术语 、 人 物 、 机 构 等 。 
同时 检索 平台 返回 “土地 改革 运动 * 的 相关 资料 , 用 户 可 以 继续 阅读 相关 国史 教育 
文本 资源 。 
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4 知识 检索 示例 
4.2 查询 问答 
为 满足 用 户 使 用 自然 语言 提问 的 检索 需求 , 设计 和 实现 了 国史 知识 查询 问答 
功能 。 利用 自然 语言 处 理 技术 对 用 户 提 出 的 问题 进行 分 析 , 构造 针对 国史 本 体 知 
识 库 的 结构 化 检索 式 ， 返 回 结果 知识 图 谱 。 例 如 ， 用 户 输入 “ 谁 提出 了 “和 带 国 主 
义 和 一 切 反动 派 都 是 纸老虎 ””， 返 回 如 图 5 所 示 的 检索 结果 知识 图 谱 ， 自 动 返 
回 “ 帝 国 主义 和 一 切 反 动 派 都 是 纸老虎 ”的 “理念 提出 者 ”是 “毛泽东 ” 
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5 查询 问答 示例 
4.3 关联 检索 
关联 检索 借助 国史 本 体 知识 库 的 图 结构 发 现实 体 之 间 的 相互 关联 , 获取 子 图 
结构 ， 控 掘 潜在 的 知识 。 例 如 检索 “陈云 ?和 “两 个 凡是 ”的 “ 近 ” 的 关联 ， 可 获得 
如 图 e 所 示 的 知识 图 谱 。 从 图 中 我 们 可 以 了 解 到 :“ 陈 云 ” 作 为 “发 言 人 或 报告 
人 ”与 “中 共 中 央 工 作 会 议 (1977 年 3 月 )” 会 议 相 关联 ， 该 会 议 的 “相关 概念 


或 术语 ”为 “两 个 凡是 ” 事件 “邓小平 第 三 次 复出 ”和 “党 内 外 对 “两 个 凡是 
的 批评 和 抵制 ”都 与 人 物 “陈云 ”概念 或 术语 “两 个 凡是 ”相关 ， 由 此 通过 子 
图 展示 了 “陈云 "和 "两 个 凡是 "的 内 在 联系 。 
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MAESA 


MRED eURUE D 


陈云 "两 个 凡是 ' 


ARAM MARE KRE 


© 
党 内 外 对 "两 个 凡是 "的 批评 和 抵制 


图 6 关联 检索 示例 
4.4 时 序 检索 
时 序 检索 允许 用 于 选择 时 间 范 围 , 查找 这 段 时 间 的 事件 、 会议、 文献 等 信息 。 
检索 1949 年 到 1950 年 的 事件 和 会 议 ， 获 得 如 图 7 所 示 的 结果 ， 包 括 67 个 时 间 
和 37 个 会 议 , 按照 时 间 顺 序 排列 , 点 击 实体 名 称 可 以 进一步 浏览 它 的 知识 图 谱 。 


检索 结果 : (67) 事 件 , (37) 会 议 


1949% | 1949 年 

E | 194951 
i 民族 区 域 自治 制度 的 建立 (1949 年 至 1955 年 ) 
| 建立 新 式 军 兵种 (1949 年 至 1953 年 ) 
i 中 国 同 苏联 等 17 国 相继 建立 外 交 关系 (1949 年 至 1950 年 ) 
j 没收 官 佑 资本 (1949 年 初 到 1950 年 初 ) 
| 中 央 人 民政 府 海关 总 署 成 立 (1949 年 到 1951 年 ) 
i 打击 投机 资本 稳定 金融 物价 (1949 年 初 至 1950 年 底 ) 
| 统一 货币 (1949 年 初 至 1959 年 ) 
| 基 疲 教 的 三 自 草 新 运动 (1949 年 至 1954 年 ) 
1949 年 2 月 


，1949 年 3 月 
| 中 共 七 届 二 中 全 会 (1949 年 3 月 ) 
i 1949 年 4 月 


图 7 时 序 检索 示例 


4.5 语义 资源 浏览 

检索 平台 在 词 条 详细 信息 页 面 提 供 了 语义 资源 浏览 功能 ， 通 过 文本 标注 程序 
将 文本 中 重要 实体 标识 出 来 , 利用 不 同 的 颜色 区 分 不 同 的 类 型 。 点 击 标注 的 实体 
名 称 自动 跳 转 到 该 实体 的 知识 图 谱 页 面 上 , 方便 用 户 通 过 知识 图 谱 进一步 了 解 相 
关 国 史 知 识 。 如 图 8 所 示 ，“ 土 地 改革 运动 ” 词 条 中 标注 了 任务 、 会 议 、 事 件 、 
机 构 、 国 家 和 地 区 、 特 殊 群 体 、 概 念 或 术语 和 文件 等 国史 实体 或 概念 。 


知识 内 容 
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标题 : 土地 改革 运动 
来 源 : 中 国共 产 党 历史 大 辞典 -社会 主义 革命 和 建设 时 期 

新 中 国 建立 初期 在 新 解放 区 开展 的 土地 制度 改革 斗争 。 没收 封建 地 主 阶 级 的 土地 眼 农民 所 有 ， 是 中 国民 主 革命 的 一 项 基本 任 
务 。 新 中 国 成 立 后 ， 、 ”等 老 新 解放 区 《〈 约 有 1. 6 亿 人 口 》， 在 人 民 和 解放 战 争 过 程 中 ， 已 经 实行 了 土地 改革 ， 消 灭 了 封建 剥 
削 制 度 ， 农 民 从 地 主 阶级 和 旧式 富农 手中 获得 了 土地 。 但 是 拥有 3.1 亿 人 口 《 其 中 农业 人 口 为 2. 64 亿 ) 的 广大 新 解放 区 则 尚未 实行 
土地 改革 。 因 此， 建国 后 ， 完 成 新 解放 区 的 土地 制度 的 改革 ， 就 成 为 一 项 重要 任务 。1950 年 1 月 24 日 ， 中 共 中 央 发 出 改 关 于 在 各 级 
人 民政 府内 设 土改 委员 会 和 组 织 各 级 农 协 直接 领导 土改 运动 的 指示 长， 开始 在 新 解放 区 实行 土改 运 动 的 准备 工作 。1950 年 6 月 ， 中 
共 七 让 三 中 全 会 讨 爷 了 新 区 土地 制度 改革 。 随后 ， 刘 少 奇 在 中 国人 民政 治 协商 会 议 第 一 届 全 国 委员 会 第 二 次 会 议 上 ， 代 表 中 共 中 
央 作 了 改 关于 土地 改革 问题 的 报告 》， 靖 明了 土地 改革 的 重大 意义 和 党 的 方针 政策 。 会 议 讨论 并 同意 刘少奇 的 报告 和 中 共 中 央 建 
议 的 土地 改革 去 草 案 。6 月 30 日 ， 中 央 人 民政 府 正式 公布 改 中 华人 民 共和 国土 避 对 去 光 。 为 了 有 准备 有 步骤 有 计划 地 进行 土地 改 
革 ， 中 共 中 央 决 定 ， 从 1950 年 冬季 开始 ， 用 两 年 半 或 三 年 左右 的 时 间 ， 根 据 和 地 区 的 不 同情 况 ， 在 全 国 分 期 分 批 地 完成 土地 改 
革 。 并 规定 在 开展 土地 羽 革 运动 之 前 ， 县 以 上 的 领导 机 关 要 选择 少数 地 区 进行 典型 试验 ， 在 做 法 上 采取 以 点 带 面 ， 点 面 结合 , 在 
总 结 经 验 的 基础 上 ， 分 批 开 展 。 经 过 充分 准备 工作 ， 从 1950 年 冬季 开始 ， 一 场 大 规模 的 土地 忆 革 运动 在 新 解放 区 农村 广泛 展开 。 
在 土地 交 革 运动 中 ， 中 共 中 央 规 定 的 土地 改革 的 总 路 线 和 总 政策 是 : 依靠 贫农 、 雇 农 ， 团结 中 农 ， 中 立 富农 ， 有 步骤 地 有 分 别 地 
消灭 封建 录 峭 制度 ， 发 展 农业 生产 。 鉴 于 解放 后 的 新 情况 ，《《 十 吉 兴 对 去 办 将 过 去 征收 富农 多 余 土 地 财产 的 政策 ， 羽 变 为 保存 富 
农 经 济 的 政策 。 此 外 ， 对 小 土地 出 租 者 也 采取 了 保护 的 政策 ， 不 征收 其 出 租 的 土地 。 土 地 改革 的 基本 内 容 ， 是 没收 地 主 的 土地 分 
给 无 地 少 地 的 农民 ， 把 封建 剥削 的 土地 所 有 制 改变 为 农民 的 土地 所 有 制 ; 同时 ， 采 取保 护 民族 工商 业 的 政策 ， 对 于 地 主 兼 营 的 工 
商业 及 其 直接 用 于 工商 业 的 土地 和 财产 、 资 金 不 予 没收 。 土地 改革 运动 坚持 了 有 领导 地 发 动 群众 的 方针 ， 做 到 领导 骨干 与 广大 农 
民 群 众 相 结 合 。 为 了 深入 地 发 动 群众 ， 各 地 政府 都 派出 土 忆 工作 团 深入 农村 ， 发 动 农民 群众 ,建立 农 会 ， 组 织 农民 向 封建 地 主 阶 
级 开展 斗争 ， 建 立 了 城乡 最 广泛 的 反 封 建 统一 战线 。 土 发 中 ， 不 但 在 农村 建立 了 占 90% 以 上 的 贫 雇 农 和 中 农 的 统一 战线 ， 保 护 了 小 
土地 出 租 者 ， 中 立 了 富农 ; 而 且 在 城市 组 织 各 方面 的 人 士 ， 包 括 广 大 的 知识 分 子 和 民主 党 派 成 员 下 乡 参加 土地 改革 ， 把 许多 同 封 
建 土地 录 悄 有 联系 的 资本 家 也 团结 到 皮 封建 的 队伍 中 来 。 在 土 忆 中 ， 对 于 地 主 分 子 ， 除 个 别 罪 大 恶 极 、 民 愤 极 大 的 予以 镇 压 外 ， 
都 分 给 一 定数 星 的 土地 ， 让 其 在 劳动 中 改造 成 为 新 人 。 土 地 改革 运动 是 有 领导 地 分 期 分 批 进行 的 ， 每 期 一 般 经 历 了 发 动 群众 、 划 
分 阶级 成 分 、 没 收 和 分 配 土地 、 复 查 总 结 等 阶段 。 到 1952 年 底 , 除 ”” 等 少数 地 区 外 ， 土 地 改革 在 全 国 农村 胜利 完成 。 加 上 老 解 
放 区 土地 改革 ， 全 国 大 约 有 3 亿 多 无 地 和 人 少 地 的 农民 分 得 了 大 约 7 亿 亩 土地 和 其 他 一 些 生产 资 料 ， 免 除了 每 年 向 地 主 缴纳 3000 万 吨 
以 上 粮食 的 地 租 。 土 地 改革 的 胜利 ， 御 底 消灭 了 封建 土地 所 有 制 ， 解 放 了 农业 生产 力 ， 进 一 步 巩固 了 工农 联盟 和 信 民 民主 专政 ， 
为 国民 经 济 的 恢复 和 发 展 ， 为 国家 社会 主义 工业 化 和 对 农业 社会 主义 改 告 创造 了 条 件 。 


图 8 语义 资源 浏览 示例 
5. 结论 


本 文 以 国史 本 体 为 基础 , 构建 了 国史 知识 检索 平台 , 探讨 了 本 体 知识 库 的 存 
储 、 索 引 、 可 视 化 以 及 基于 本 体 的 知识 检索 技术 。 本 研究 利用 本 体 从 更 精细 的 角 
度 来 表示 和 组 织 国史 知识 ,实现 了 实体 检索 、 查 询问 答 、 关 联检 索 和 时 序 检索 等 
结构 化 、 细 粒度 的 检索 服务 ， 同 时 支持 了 国史 知识 的 深度 挖 气 与 探索 ,扩展 了 信 
居 检 索 的 深度 ， 提 高 了 知识 获取 的 效率 。 此 外 ， 通过 知识 图 谱 可 视 化 和 语义 资源 
浏览 丰富 了 检索 结果 的 呈现 形式 ,改进 了 用 户 体 验 , 提高 了 “中 华人 民 共 和 国史 
教育 网 ”的 互动 性 和 新 矣 性 。 在 后 续 的 工作 中 ,将 继续 增加 国史 本 体 知 识 库 的 实 
例 ， 丰富 知 识 库 的 内 容 ， 同 时 提高 检索 平台 在 大 规模 数据 处 理 上 的 性 能 ， 进 一 步 
提升 平台 服务 效果 。 
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Construction of Knowledge Retrieval Platform based on Historic 


Ontology of the People's Republic of China 
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Abstract: [Purpose/Significance] To build a historic knowledge retrieval platform, improve the 
efficiency access for users to history of the People's Republic of China, and promote its publicity 
and education. [Method/Process] This paper proposes the construction idea and framework of the 
knowledge retrieval platform based on historic ontology of the People's Republic of China. Based 
on the ontology knowledge base, this platform uses Neo4j database as data storage, creates three 
index based on Solr, including instance index, triple index and text item index. For various 
retrieval demands, the execution process of retrieval engine, construction method of retrieval 
expression, query processing algorithm and knowledge visualization are designed and 
implemented. [Result/Conclusion] The knowledge retrieval platform has been constructed, which 
provides entity search, query answering, relevance search, temporal retrieval and semantic 
resources browsing services. Its framework and implement of key technologies can provide an 
important reference for depth retrieval service on other domain knowledge. 
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